这个时代的滑稽和伟大之处皆在于,我们每天要证明自己是自己。
在淘宝上购买一件衣服,你需要扫一扫「人脸识别」,证明一下你是你;去公司上下班,你需要点一点「指纹识别」,证明一下你是你;如果你在银行、政府单位的“重要场景”中工作,你还得接受一下「虹膜识别」,证明一下你的确是你。
而上述这些技术,统称为生物识别。声纹识别便是其中之一。
声纹识别也被称为「说话人识别」,它最主要的功能是确认说话人的身份。和其他生物识别技术一样,它也有自己的“不可替代性”。
和指纹识别技术不同的是,声纹识别技术可以做到无感知、零接触,你不需要用手指触摸那一块留下无数人细菌和病菌的部位;而相比于人脸识别,在疫情期间,人们带着口罩依然可以使用声纹识别技术。
声扬科技是一家专注于“声音科技”的公司,在声纹技术上深耕多年。
声扬科技联合创始人、CTO陈东鹏博士认为,现代社会,远程交互方式越来越多,在一些特定的智能硬件场景中,只允许语音的方式进行交互,没有办法通过人脸或者指纹来采集到身份信息,所以在这些场景下,声纹识别是唯一一种可以确认人们身份信息的生物识别方式。
声纹识别不仅具有唯一性,而且应用范围十分广泛。
根据美国哈佛商学院有关研究人员的分析资料表明,人的大脑每天通过五种感官接受外部信息,其中视觉占83%,听觉仅次于视觉,占比11%,人们每天要接听各种各样的“声音”。
而作为声音领域的技术之一,声纹识别也在逐渐扩大自己在人类生活中的影响力。
目前,声扬科技通过声纹识别技术在金融、社保、公安、智能硬件等领域落地了很多场景。
“比如在金融场景中,当客户呼入热线电话,金融机构就可以通过声纹技术自动识别客户的身份;当客户想远程开户、开卡或者线上支付,金融机构也可以通过声纹识别技术确认客户身份,降低客户账户被盗用的风险。”陈东鹏说到。
目前,工商银行、恒丰银行、重庆银行等金融机构已经相继采用了声扬科技的产品,并取得不错的效果。
工行“利器”
2020年,是金融科技发展的重要一年,央行和五大行的金融科技子公司不仅全部建成,而且它们还与各家金融科技创企频频合作。
其中,工商银行首创的声纹风控模式,于今年6月在北京、湖北、四川、陕西4家分行上线,投产上线仅一周,累计交易逾万笔,成功防堵欺诈数十笔,挽回经济损失数十万元。而工行官网中的产品项目披露显示,其背后的声纹识别技术提供方,就是声扬科技。
声扬科技CTO陈东鹏表示,刚接触工行时,声扬科技公司总共只有20多人,对于工行这种大体量的银行来说,很少会采购小公司的产品,但是声扬科技在这两年时间里一直坚持完成了工行所有的严格测试,经历了三轮POC测试,每一轮都是以技术分第一的成绩通过,因此得到了工行的亲睐。
银行一直是欺诈分子最容易直接获得利益的行业之一,也是欺诈发生的“重灾区”。欺诈分子会冒充其他人的身份,拿其他人的ID重复申请信用卡,骗取钱财。现在银行的开卡服务都是线上的,使得这类欺诈操作更方便进行。
“每个人的声纹都是独一无二的,有了声纹识别之后,银行可以轻易地识别出频繁开卡的“声音”,把它的风险等级提高并做进一步的排查,显著地降低了银行的坏账率。”陈东鹏说。
此外,声扬科技还为恒丰银行提供了声纹识别技术,主要用于手机银行的登录。客户通过声纹登陆手机银行,而客户的声纹会给银行的后续风控提供“基础”。当有人用声纹信息登录手机或者电话交易的时候,银行可以通过即时的比对声音,判断身份,提前防控风险。
去年,平安壹账通在客服场景中还应用了声扬科技的声纹识别技术。在客服质检领域,声纹识别技术把客服和客户的语音分开,基于原有的海量电话录音数据,平安壹账通可以方便快捷地分析客服的服务质量。
陈东鹏介绍到:”第一步,通过我们提供的声纹识别技术,金融机构可以把客服和客户的声音分开。当客户的声音独立开来后,金融机构可以使用后续的其他技术,比如语音识别等。智能语音处理技术能够精确的去追踪客服说了什么、客户说了什么,通过对这些内容进行分析,可以提高客服的服务质量和客户的满意度。”
遇到“瓶颈”
当然,专注“声纹识别技术”的公司并非一帆风顺,现阶段的发展仍遇到诸多难题。
陈东鹏说:“声音的传播很容易受到周围环境的干扰,比如噪声、回声、人声都会影响声纹识别。”
他认为,目前这些问题还都没有被业内专家彻底解决,只能说回声等部分问题的处理方法已经做的比较好;而噪声也可以通过深度学习这种基于海量数据的训练来作为一个很好的提升;在硬件方面,更“宽敞”的通信信道,能够更好地保护音质。
此外,如果你用完全不同的通信设备来进行注册和验证,声纹识别的准确率也会受到一定影响。
“声纹识别的适用范围,一般距离设备2~5米,而人类一般可以听到10米范围内的对话。如何扩大声纹识的适用范围,也是科技公司需要攻克的难题。”陈东鹏说。
声纹识别只是一种单一的技术,它不能解决所有的技术问题。它仍需要跟其他的技术相结合,才能形成最大的合力。
在非常重要的核实身份的场景下,人们通常会选择两种或者三种身份认证模式。目前,大多数有实力的金融机构都会采用多模态的风控,这种风控方式大大提升了识别身份的准确率。
陈东鹏举例:“我们和一家行业领先的人脸识别技术提供商合作做一款双录认证产品。客户它只需要对着摄像头说几个数字,就同时完成了人脸+声纹的双重认证。这样的错误率会比百万分之一还要低,既安全又方便。”
“同时,声纹识别也在这个过程中也替代了人脸活体检测,因为你在念这些数字的时候,不需要像传统人脸识别那样做那些张嘴、眨眼等摇头晃脑的动作了,声纹识别的体验非常的自然。”陈东鹏说。
等风来
随着技术的不断突破,声纹识别市场和应用场景也被逐步打开。
据前瞻产业研究院分析,当下全球生物识别产业规模庞大,仅声纹识别这一细分方向的市场规模2020年有望超过1400亿元人民币,占整个生物识别市场的22.4%。
目前关于声纹识别的应用也越来越多,例如在智能硬件领域,国外的科技巨头谷歌公司便推出了一款声纹支付的支付方式,它的原理是根据每个人声音的不同特点从而进行个体化的支付。这种支付方式已经被谷歌公司应用到智能音箱中,相比二维码支付、指纹支付和人脸支付,它具有更高的便捷性,这项技术不仅可以用于金融支付,还可以用于一些防盗系统或是门禁。
在国内,华为也推出了支持声纹识别的手机Mate 20 Pro,打开了消费电子领域的应用市场。我们在配搭耳机的时候只需要说出“微信支付”或“支付宝支付”,手机就会自动解锁并展示对应的二维码。国内的智能音箱品牌——天猫精灵也具备声纹识别的功能,绑定声纹之后人们可以用它来完成点外卖、网购、交话费等支付操作。
对此,陈东鹏说:“凡是涉及到语音交互的地方,都是声纹可以发挥作用的场景。”
未来随着5G、大数据、云计算等新技术发展愈发成熟、语音的入口更普及,可利用的语音数据会越来越多,声纹识别市场将迎来爆发。
当被问及声纹识别技术的未来发展时,陈东鹏很有信心,他说道:“目前整个市场还处在爆发期,随着工商银行等行业巨头开始应用和大规模推广声纹风控模式,其他银行势必将加快速度跟上前行者的脚步。”(雷锋网雷锋网雷锋网)